﻿ Conservarea digitală a patrimoniului umanității și rolul cărții online Dan Cristea Partea 1: De ce păstrăm datele textuale în digital? Modă sau necesitate? Teleconferința internaonală a nerilor cercetători “Crearea Societății Conșinței” – 22-23 apr 2016 Real sau virtual? • Suntem inundați de informații – Percepția senzorială: auz, văz, miros, tacl, gust – În natură: sunete, imagini, parfumuri, angeri, gusturi • Tehnicile de realitate virtuală – Care dintre senzații sunt perfect reproducbile și care doar palid? – Putem reproduce societatea prin tehnici digitale? – Putem reconstrui trecutul? – Dorim să lăsăm posterității senzațiile pe care le trăim noi acum când pășim pe stradă, când ne întâlnim cu prieteni, când ieșim în natură? Teleconferința internaonală a nerilor cercetători “Crearea Societății Conșinței” – 22-23 apr 2016 Digital? Pentru ce? • Reproducem în digital pentru că realul e atât de prețios și nu vrem să-l pierdem, nu pentru că surogatul digital ar ﬁ de mai mare valoare decât realul… • La polul maxim al suspiciunilor: are reconstrucția digitală valoare culturală? – E lipsită de materialitate! – Nu e cumva un kitch? – Am vrea să populăm un muzeu de artă cu reproduceri ale tablourilor, în lipsa originalelor? Teleconferința internaonală a nerilor cercetători “Crearea Societății Conșinței” – 22-23 apr 2016 Ce sunt obiectele digitale? • Texte, sunete, imagini 2D și 3D, ﬁlme, animații 3D (reconstrucții), inclusiv produse instantaneu prin rularea unor programe • Dar mai ales: combinații complexe între ele Teleconferința internaonală a nerilor cercetători “Crearea Societății Conșinței” – 22-23 apr 2016 Datele textuale pe Web Aprox 2,7 zetabytes de date există astăzi online4% 1 ZB = 10007bytes = 1021bytes Teleconferința internaonală a nerilor cercetători “Crearea Societății Conșinței” – 22-23 apr 2016 Text: digital versus clasic • Avantaje – poate ﬁ dată unui public mult mai larg – spațiu de depozitare mic – mult mai ușor de căutat și de accesat – poate ﬁ folosită ușor pentru a crea noi valori, artefacte digitale – în principiu, nedegradabilă Teleconferința internaonală a nerilor cercetători “Crearea Societății Conșinței” – 22-23 apr 2016 Digital versus clasic • Dezavantaje – diﬁcultăți enorme în păstrarea pe termen lung – reînnoirea permanentă a soului de stocare și acces – pe măsură ce infrastructura se schimbă • sisteme scalabile • compabile diferitelor puri de obiecte digitale – necesită un personal IT de specialitate caliﬁcat – “randament mai mic în studiu” – “sasfacție redusă în lectură” Teleconferința internaonală a nerilor cercetători “Crearea Societății Conșinței” – 22-23 apr 2016 Instuțiile memoriei • Păstrătoare ale patrimoniului societății – Responsabile pentru captarea și conservarea de “eșanoane reprezentave ale societății” • Annee Balle Sorensen, Filip Kruse: Preservaon Planning: User Requirements for Digitally Preserved Materials, in Ercim News, Jan 2010 – Muzeele și arhivele: responsabile de conservarea originalelor – Bibliotecile: responsabile de păstrarea cópiilor (deși cărțile de patrimoniu sunt păstrate acolo ȘI în original) Teleconferința internaonală a nerilor cercetători “Crearea Societății Conșinței” – 22-23 apr 2016 Partea a 2-a: Un parcurs tehnologic Ce se mai întâmplă în lume în domeniul conservării patrimoniului spiritual? Teleconferința internaonală a nerilor cercetători “Crearea Societății Conșinței” – 22-23 apr 2016 Tehnologia conservării digitale • Infrastructura conținutului digital – preluarea – stocarea – accesul – prelucrarea – securitatea datelor Teleconferința internaonală a nerilor cercetători “Crearea Societății Conșinței” – 22-23 apr 2016 Tehnologia conservării digitale • Conservarea de lungă durată – asigurarea accesului la obiectele digitale pe perioade extrem de lungi (decenii, secole) • nu atât perimarea ﬁzică a suporturilor… • cât perimarea lor morală • infrastructura se modernizează într-un ritm din ce în ce mai accelerat => incompabilități hardware și soware – accesul la informație – rularea aplicațiilor suport – interfețe ulizator care nu mai pot “ci” vechile formate – necesitatea de a concepe sisteme specializate de conservare => eforturi de cercetare ﬁnanțate de UE • suporturi pentru back-up (renașterea benzilor magnece…) Aspecte legale (drepturi de autor) • Dreptul de a stoca resursele • De a le difuza/reproduce (cui și sub ce licențe?) • De a le exploata (în folos didacc, al cercetării, comercial) • Open Data? • V proiecte gen Google Books Teleconferința internaonală a nerilor cercetători “Crearea Societății Conșinței” – 22-23 apr 2016 Cine ulizează conținutul digital • Instuțiile memoriei – facilitând accesul publicului • Instutele de cercetare șințiﬁcă, universitățile – studierea trecutului și a… viitorului (paernuri) – elaborarea de modele • Antreprenori comerciali, industriali – ca deținătoare a infrastructurii de achiziție și prelucrare – dezvoltatoare de aplicații și servicii bazate pe conținut – exploatarea comercială în conexiune cu piața Teleconferința internaonală a nerilor cercetători “Crearea Societății Conșinței” – 22-23 apr 2016 Exploatarea comercială • Procesarea informațiilor => lanțul cunoaștere- valoare => economie a cunoașterii • Agenți economici (inclusiv cercetare industrială): depind de resurse digitale • Zona Big Data: extrem de ofensivă… Teleconferința internaonală a nerilor cercetători “Crearea Societății Conșinței” – 22-23 apr 2016 Exemplu de infrastructură de conservare digitală • PROTAGE – PReservaon Organizaon using Tools in AGent Environments (proiect de cercetare FP7) – agenți soware inteligenți și servicii Web pentru conservare digitală – monitorirează procesul de conservare digitală – automazează transferul de obiecte digitale între depozite digitale Teleconferința internaonală a nerilor cercetători “Crearea Societății Conșinței” – 22-23 apr 2016 PROTAGE • Permite creatorilor de conținut digital să producă și să publice obiecte digitale într-o manieră compabilă conservării pe perioade îndelungate de mp • Facilitează interoperabilitatea dintre creatorii de conținut digital (biblioteci și arhive) și consumatori • Oferă mijloace de automazare a proceselor de conservare Teleconferința internaonală a nerilor cercetători “Crearea Societății Conșinței” – 22-23 apr 2016 Rețeaua DARIAH • Interesată de date șințiﬁce ulizate în șințele umaniste • Crearea unei infrastructuri solide care să asigure stabilitatea de lungă durată a valorilor digitale – aspecte de natură tehnică, sociologică etc • Standarde, bune pracci – Text Encoding Iniave (TEI) Teleconferința internaonală a nerilor cercetători “Crearea Societății Conșinței” – 22-23 apr 2016 DARIAH • “Surogate digitale”: – rezumări/transformări ale formatelor originare: metadate, imagini scanate ale documentelor, fotograﬁi digitale, transcrieri ale surselor textuale, analize spectrale ale înregistrărilor vocale – referințe pentru cercetare în lipsa originalelor ori completându-le – ulizate ca surse pentru crearea de noi surogate Teleconferința internaonală a nerilor cercetători “Crearea Societății Conșinței” – 22-23 apr 2016 Google Books Library project (hp://www google com/googlebooks/library/): – 130 milioane de tluri disncte • 480 de limbi • 20% în domeniul public • 10-15% in print • restul: out of print – 25 milioane cărți scanate (oct 2015) – lucrează cu 40 de mari biblioteci “our goal is to improve access to books – not to replace them” Teleconferința internaonală a nerilor cercetători “Crearea Societății Conșinței” – 22-23 apr 2016 Alte proiecte • Europeana – bibliotecă digitală europeană – inițiava EU (2005): Jacques Chirac & alți președinți – contribuie 2000 instuții – în 2010: +10 ml obiecte digitale (hp://www europeana eu/portal/) • Gutenberg – efort colecv voluntar de a digiza și stoca opere de cultură (degrevate de drepturi de autor) în format digital – Autor: Michael Hart – oct 2015: 50 000 obiecte digitale (hps://en wikipedia org/wiki/Project Gutenberg) Acțiunea COST e-Read • Multe speculații asupra implicațiilor digizării asupra cogniției: probe empirice care indică impactul negav emoțional și cogniv al cirii de pe ecran • E-Read încearcă să explice pe temeiuri șințiﬁce implicațiile digizării în lectură, pentru a ajuta persoanele (societatea Europeană) să facă față opm efectelor • Folosește modele muldimensionale, integrave are lecturii, combină paradigme din șințele experimentale cu perspecve din șințele umaniste (e g , diacronică) => dezvoltă noi paradigme de cercetare și metrici pentru evaluarea impactului digizării asupra actului lecturii Teleconferința internaonală a nerilor cercetători “Crearea Societății Conșinței” – 22-23 apr 2016 Partea a 3-a: Cartea online Dincolo de deliciile lecturii Teleconferința internaonală a nerilor cercetători “Crearea Societății Conșinței” – 22-23 apr 2016 Kindle • Adecvat contextelor de lectură precare (vacanță, călătorie) – “încarc în Kindle doar cărți ușoare, memorialiscă, polițiste…” => nu predispune reﬂecțiilor – “nu mi-am făcut niciodată note…” – “cărțile mari trebuie cite de pe hâre…” Teleconferința internaonală a nerilor cercetători “Crearea Societății Conșinței” – 22-23 apr 2016 Ce e cartea online? • Google: – 234 000 de rezultate în căutarea expresiei “car online” – 6 500 000 rezultate pentru “online books” • În principal: portaluri de unde pot descărca gratuit cărți digitale? • Există și o altă dimensiune… Teleconferința internaonală a nerilor cercetători “Crearea Societății Conșinței” – 22-23 apr 2016 MappingBooks: evadează din carte în lumea virtuală și… reală! Teleconferința internaonală a nerilor cercetători “Crearea Societății Conșinței” – 22-23 apr 2016 Ideea • În prezent: ﬁecare carte – atâția citori… • MappingBooks: Cumpăr o carte… Incredibil! A fost scrisă special pentru mine! Teleconferința internaonală a nerilor cercetători “Crearea Societății Conșinței” – 22-23 apr 2016 Ce ar ﬁ să pot ieși afară din carte… Çelebi Mh , Maç Sk, Beyoğlu, Turkey to Çukur Cuma Cd, Beyoğlu, Turkey - Google Maps10/3/13 8:13 PMKatip Directions to Çukur Cuma Cd, Beyo!lu, Turkey 400 m – about 4 mins Walking directions are in beta Use caution – This route may be missing sidewalks or pedestrian paths Katip Çelebi Mh , Maç Sk, Beyo!lu, Turkey" 1 Head southwest on Maç Sk toward Baltacı Çkgo 75 m About 47 secstotal 75 m 2 Turn right onto Turnacıba"ı Cdgo 28 m total 100 m 3 Turn left onto A!a Külhanı Sk (Altıpatlar Sk )go 130 m About 2 minstotal 240 m 4 Continue onto Çukur Cuma Cdgo 150 m About 1 mintotal 400 m Teleconferința internaonală a nerilor cercetători “Crearea Societății Conșinței” – 22-23 apr 2016 Page 1 of 2https://maps google com/maps?f=d&source=s d&saddr=Maç+Sokak,+I…,288 55,2 369,37 281,0&layer=c&ei=OqVNUp3mE8nTtAaWr4CgCQ&pw=2 MappingBooKs: către… cărțile vii • Construcții muldimensionale care combină date de natură textuală, geograﬁcă, temporală • Pune în evidență mențiunile de persoane, locații… • Ulizează tehnici de legare a entăților (enty linking) – conectează mențiuni din carte în lumea virtuală • Legături sensibile la: – contextul mențiunii din carte – locația curentă a citorului – momentul lecturii – personalitatea și preferințele citorului Exemple de ulizare - Vizitez un oraș cu un ghid de călătorie în mână - locurile de interes, traseele, sunt re-ordonate în funcție de poziția mea - Sunt elev și călătoresc cu trenul de la Sibiu la Bucureș… - dacă îmi deschid tableta și o îndrept spre fereastra din dreapta, voi vedea semnalate vârfurile munților Făgăraș, exact ca în manualul de Geograﬁe - Sunt în Paris pentru a 3-a oară… - dar numai acum ghidul meu MB Lonely Planet îmi semnalează această expoziție deschisă în Piramidă Teleconferința internaonală a nerilor cercetători “Crearea Societății Conșinței” – 22-23 apr 2016 Exploatarea informației textuale în MappingBooks Aplicația 1) conectează mențiuni ale entăților (grupuri nominale) => ﬁecărei entăți îi corespunde un lanț coreferențial; 2) Baza de cunoșnțe nu conține niciun fel de înregistrări despre entăți => ea se dezvoltă plecând de la zero; 3) Idenﬁcă relații geograﬁce (poziții reciproce, distanțe, apropiere, intersecții etc ); 4) Textele invesgate: manuale de Geograﬁe și ghiduri de călătorie Teleconferința internaonală a nerilor cercetători “Crearea Societății Conșinței” – 22-23 apr 2016 MappingBooks se adresează… • Tinerilor, elevilor – îi putem oare recâșga ca citori? • Adolescenților, aventurierilor, călătorilor, iubitorilor de excursii – socializare asupra locurilor aminte în ghiduri • Pensionarilor – relaționare asupra lecturilor comune, preferințelor culturale • Cercetătorilor în Tehnologia limbajului & Lingviscă computațională – acces la resurse lingvisce adnotate • Deținătorilor de date textuale (edituri, companii media, ziare) – pentru a-și vinde mai bine produsele • Administrația locală, agențiilor turisce – popularizarea locațiilor de interes local sau turisc Teleconferința internaonală a nerilor cercetători “Crearea Societății Conșinței” – 22-23 apr 2016 MappingBooks: mulțumiri • Studenților de la Fac Informacă – protop, ca proiect de semestru la cursul de IA, 2013-2014 • Ministerului Educației și Cercetării, pentru grant: iulie 2014 – decembrie 2017 • Colegilor mei: Ionuț Pistol, Daniela Gîfu, Daniel Anechitei (Fac Informacă), Mihai Niculiță (Fac Geograﬁe) • Partenerilor din proiect: Univ “Ștefan cel Mare” Suceava, SIVECO – Bucureș Teleconferința internaonală a nerilor cercetători “Crearea Societății Conșinței” – 22-23 apr 2016 Iar dumneavoastră, vă mulțumesc pentru bunăvoința de a mă asculta! 35 Teleconferința internaonală a nerilor cercetători “Crearea Societății Conșinței” – 22-23 apr 2016 